ارائه روش ترکیبی و مفهومی جدید برای بسط پرس و جوی متون در سیستم های بازیابی اطلاعات

پایان نامه
چکیده

در بازیابی اطلاعات متون افزایش دقت بازیابی و کاهش زمان پاسخ امری بسیار مهم می باشد. از جمله مواردی که می توان برای بهبود دقت استفاده کرد، بهبود الگوریتم های بسط پرس و جو می باشد. در بسط پرس و جو با بهبود پرس و جوی کاربر سعی می شود پرس و جوی کاربر را که بصورت غیر ساخت یافته عنوان شده است به پرس و جوی دقیق تر تبدیل کرده و به این ترتیب دقت بازیابی را بالا ببریم. لذا بسط پرس و جو از جمله موارد مهم در سیستم های بازیابی اطلاعات است که درزمینه? متون امکان بهبود الگوریتم ها و کاهش زمان اجرا وجود دارد. هدف اصلی ما ارائه بهترین روش از بین روش های موجود ودرصورت امکان ترکیبی از الگوریتم های انتخاب شده برای بهبود روش های پرس جو به صورت مفهومی و استفاده در مجموعه مستندات بزرگ می باشد. در کارهای پیشین صورت گرفته از روش های پایه ای برای بسط پرس و جو در پایگاه های داده کوچک استفاده شده است بنابراین استفاده از یک مدل هیبریدی با توجه به مجموعه مستندات بزرگ با افزایش کیفیت و دقت نسبت به روش های مرجع امری جدید در این حوزه می باشد. در این پژوهش، ما از رزومه های اساتید دانشگاه ها به عنوان مجموعه مستندات استفاده کرده و با استفاده از خوشه بندی و ماتریس همبستگی کلمات و ایجاد گراف رابطه برای هر کلمه یک مدل هیبریدی جدید برای بسط پرس و جو ارائه کرده ایم که در مقایسه با روش های مرجع نتایج بهتری دارد.

منابع مشابه

ارائه روشی جدید برای شاخص‌گذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشه‌بندی متون

Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...

متن کامل

ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار

In this article a pre-processing method is introduced which is applicable in speech recognized texts retrieval task. We have a text corpus, t generated from a speech recognition system and a query as inputs,  to search queries in these documents and find relevant documents. A basic problem in a typical speech recognized text is some error percentage in recognition. This, results erroneously ass...

متن کامل

بازیابی متون چاپی فارسی بر اساس پرس و جوی کلمات

در این پایان نامه روشی جدید برای بازیابی و جستجوی کلمات فارسی از میان متون تصویری فارسی ارائه شده است. همچنین روشی مبتنی بر اندازه و شکل نقاط موجود در مستند پس از آستانه گذاری، جهت تشخیص قلم و اندازه قلم مستندات تصویری فارسی ارائه شده است. روش ارائه شده برای تشخیص قلم از اولین روش هایی می باشد که می تواند با دقت بسیار بالایی اندازه قلم مستند فارسی را هم تشخیص دهد. برای ارزیابی روشهای ارائه شده ...

15 صفحه اول

ارائه روشی جدید برای شاخص گذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشه بندی متون

در زبان فارسی کلمات دارای صورت های نگارشی متنوعی هستند و پوشش کلیه حالات دستوری کلمات با به کارگیری یک سری قواعد معین ناممکن است به همین دلیل استخراج کلمات کلیدی به طور خودکار از متون فارسی دشوار و پیچیده است. در این مقاله سعی شده است با استفاده از اطلاعات زبان شناختی و اصطلاح نامه ، کلمات کلیدی بامعناتری ارائه شود. با استفاده از اصطلاح نامه که از نظامی ساختارمند برخوردار است می توان شبکه کلمات...

متن کامل

ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار

در این پایان نامه، یک پیش پردازش برای روشهای بازیابی اطلاعات، ارائه می شود، که برای بازیابی اطلاعات حاصل از متون بازشناسی شده ی گفتاری، مناسب است. ورودیهای مسئله اسناد متنی بدست آمده از بازشناسی گفتار و پرس و جو است. هدف یافتن اسناد مرتبط می باشد. مشکل این است که متن حاصل از بازشناسی گفتار، همواره دارای درصدی خطا در بازشناسی است که موجب می شود، بازیابی به خوبی عمل نکرده و اسناد مرتبط تشخیص داده...

15 صفحه اول

Degenerate Four Wave Mixing in Photonic Crystal Fibers

In this study, Four Wave Mixing (FWM) characteristics in photonic crystal fibers are investigated. The effect of channel spacing, phase mismatching, and fiber length on FWM efficiency have been studied. The variation of idler frequency which obtained by this technique with pumping and signal wavelengths has been discussed. The effect of fiber dispersion has been taken into account; we obtain th...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده کامپیوتر و فناوری اطلاعات

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023